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Vorrichtung zum Analysieren eines Audiosignals hinsichtlich von 
Rhythmusinformationen des Audiosignals unter Verwendung einer 

Autokorrelationsfunktion 

Beschreibung 

Die vorliegende Erfindung bezieht sich auf Signalverarbeitungs- 
konzepte und insbesondere auf die Analyse von Audiosignalen hin- 
sichtlich von Rhythmusinf ormationen . 

In den letzten Jahren ist die Verf iigbarkeit multimedialen Daten- 
materials, wie z. B. Audio- oder Video-Daten, stark gestiegen. 
Dies ist auf eine Reihe von technischen Faktoren zuriickzuf iihren, 
welche sich insbesondere auf die breite Verfiigbarkeit des Inter- 
nets, von leistungsfahiger Rechnerhard- und Software sowie von 
leistungsfahigen Verfahren zur Datenkompression, d, h. Quellco- 
dierung, von Audio- und Videoverf ahren stiatzen. 

Die riesigen Mengen audiovisueller Daten, die beispielsweise auf 
dem Internet weltweit verfugbar sind, verlangen nach Konzepten, 
die es ermoglichen, diese Daten nach inhaltlichen Kriterien be- 
urteilen, katalogisieren usw. zu konnen. Es besteht der Wunsch, 
in der Lage zu sein, multimediale Daten gezielt durch Angabe 
sinnvoller Kriterien zu suchen und aufzufinden. 

Dies erfordert sogenannte ,,inhaltsbasierter'" Techniken, die aus 
den audiovisuellen Daten sogenannte Merkmale, die in Fachkreisen 
auch als ^Features^' bezeichnet werden, extrahieren, welche wich- 
tige charakteristische Eigenschaf ten des Signals reprasentieren . 
Basierend auf solchen Merkmalen bzw. Kombinationen dieser Merk- 
male konnen Ahnlichkeitsbeziehungen bzw. Gemeinsamkeiten zwi- 
schen Audio- oder Videosignalen hergeleitet werden. Dieser Vor- 
gang erfolgt durch Vergleich bzw. In-Beziehung-Setzen der extra- 
hierten Merkmalswerte aus den verschiedenen Signalen, welche 
auch einfach als „Stucke'' bezeichnet werden. 



Von besonderem Interesse ist die Bestimmung bzw. Extraktion von 
Merkmalen, die nicht nur signaltheoretische, sondern moglichst 
unmittelbare semantische Bedeutung haben, d. h. vom Horer un- 
mittelbar empfundene Eigenschaf ten reprasentieren . 

Dies ermoglicht es dem Benutzer, auf einfache und intuitive Wei- 
se Suchanfragen zu formulieren, urn Stucke aus dem gesamten vor- 
handenen Datenbestand einer Audiosignal-Datenbank zu finden. 
Ebenso erlauben es semantisch relevante Merkmale, Ahnlichkeits- 
beziehungen zwischen Stucken zu modellieren, die der menschli- 
Chen Empfindung nahe kommen. Die Verwendung von Merkmalen, die 
semantische Bedeutung haben^ ermoglicht auch beispielsweise ein 
automatisches Vorschlagen von fur einen bestimmten Benutzer in- 
teressanten Stucken, wenn seine Vorlieben bekannt sind. 

Im Bereich der Musikanalyse ist das Tempo ein wichtiger musika- 
lischer Parameter, der semantische Bedeutung hat. Das Tempo wird 
iiblicherweise in „Beats per Minute^^ (BPM) gemessen. Die automa- 
tische Extraktion des Tempos sowie der Taktschwerpunkte des 
^Beats'' bzw. allgemein gesagt die automatische Extraktion von 
Rhythmusinformationen, ist ein Beispiel fur die Gewinnung eines 
semantisch wichtigen Merkmals eines Musikstucks. 

Weiterhin besteht ein Wunsch dahingehend, dass die Merkmalsex- 
traktion, d. h. das Extrahieren von Rhythmusinf ormationen aus 
einem Audiosignal, robust und rechenef f izient stattfinden kann . 
Robustheit bedeutet, dass es keine Rolle spielen darf, ob das 
Stuck quellcodiert und wieder decodiert worden ist, ob das Stuck 
uber einen Lautsprecher abgespielt und von einem Mikrophon emp- 
fangen worden ist, oder ob es von einem Instrument oder einer 
Mehrzahl von Instrumenten gespielt wird. 



Fiir die Bestimmung der Taktschwerpunkte und damit auch des Tem- 
pos, d. h. fur die Bestimmung von Rhythmusinf ormationen, hat 



sich in den Fachkreisen auch der Begriff ,,Beat Tracking'^ eta- 
bliert. Aus dem Stand der Technik ist es bereits bekannt, ein 
Beat Tracking auf der Basis einer notenartigen bzw, transkri- 
bierten Signaldarstellung, z. B. im Midi-Format, durchzuf uhren . 
Ziel ist es jedoch, keine solchen Metadarstellungen zu benoti- 
gen, sondern eine Analyse direkt mit einem z. B. PCM-codierten 
Oder allgemein gesagt digital vorliegenden Audiosignal vorzuneh- 
men . 

Die Fachverof fentlichung ,,Tempo and Beat Analysis of Acoustic 
Musical Signals'" von Eric D. Scheirer, J. Acoust. Soc. Am, 
103:1, (Jan 1998), Seiten 588 - 601, offenbart ein Verfahren zur 
automatischen Extraktion eines rhythmischen Pulses aus musikali- 
schen Exzerpten, Das Eingangssignal wird mittels einer Filter- 
bank in eine Reihe von Teilbandern auf gespalten, beispielsweise 
in 6 Teilbander mit Ubergangsf requenzen von 200 Hz, 400 Hz, 800 
Hz, 1600 Hz und 3200 Hz. Fiir das erste Teilband wird eine Tief- 
passf ilterung durchgefiihrt . Fiir das letzte Teilband wird eine 
Hochpassf ilterung durchgefiihrt, fiir die restlichen, dazwischen 
liegenden Teilbande wird eine Bandpassf ilterung beschrieben. Je- 
des Teilband wird f olgendermafi>en verarbeitet. Das Teilbandsignal 
wird zunachst gleichgerichtet . In anderen Worten ausgedriickt 
wird der Absolutbetrag der Abtastwerte bestimmt. Die resultie- 
renden n Werte werden dann geglattet, beispielsweise mit einer 
Mittelung iiber ein geeignetes Fenster, um ein Hiillkurvensignal 
zu erhalten. Zur Senkung der Rechenkomplexitat kann das Hiillkur- 
vensignal unterabgetastet werden. Die Hiillkurvensignale werden 
dif ferenziert, d. h. plotzliche Anderungen der Signalamplitude 
werden durch das Dif f erenzierungsf ilter bevorzugt weitergelei- 
tet- Das Resultat wird dann auf nicht-negative Werte begrenzt. 
Jedes Hiillkurvensignal wird dann in eine Bank resonanter Filter, 
d. h- Oszillatoren, gegeben, die jeweils ein Filter fiir jeden 
Tempobereich enthalten, so dass das zum musikalischen Tempo pas- 
sende Filter am starksten angeregt wird. Fur jedes Filter wird 
die Energie des Ausgangssignals als Mali fiir die Ubereinstimmung 



des Tempos des Eingangssignals mit dem zum Filter gehorigen Tem- 
po berechnet. Die Energien fur jedes Tempo werden schliefilich 
iiber alle Teilbander aufsummiert, wobei die grofite Energiesumme 
das als Resultat gelieferte Tempo, d. h. die Rhythmusinf ormatio- 
nen, kennzeichnet . Im Gegensatz zu Autokorrelationsverf ahren 
wird als vorteilhaft herausgestellt , daB die Oszillatorbank auch 
mit Ausgangssignalen bei dem doppelten, dreifachen, etc. des 
Tempos Oder auch bei rationalen Vielfachen (z. B. 2/3,' 4/3) des 
Tempos auf einen Stimulus reagiert . Eine Autokorrelationsf unkti- 
on hat diese Eigenschaft nicht, sie liefert nur Ausgangssignale 
bei dem halbierten, gedrittelten, etc. Tempo. 

Ein wesentlicher Nachteil dieses Verfahrens besteht in der gro- 
fien Rechen- und Speicherkomplexitat insbesondere zur Realisie- 
rung der groJien Zahl von parallelschwingenden „Oszillatoren" , 
von denen letztlich nur ein einziger ausgewahlt wird. Dies macht 
eine effiziente Implementierung beispielsweise fiir Echtzeitan- 
wendungen nahezu unmoglich. 

Die Fachverof fentlichung „Pulse Tracking with a Pitch Tracker" 
von Eric D. Scheirer, Proc. 1997 Workshop on Applications of Si- 
gnal Processing to Audio and Acoustics, Mohonk, NY, Oct 1997, 
beschreibt einen Vergleich des oben beschriebenen „Oszillator- 
konzeptes" mit einem Alternativkonzept, das auf der Verwendung 
von Autokorrelationsfunktionen zur Extraktion der Periodizitat 
aus einem Audiosignal, d. h. der Rhythmusinf ormationen eines Si- 
gnals, aufbaut. Ein Algorithmus zur Modellierung der menschli- 
chen Tonhohenwahrnehmung, d. h. des Pitch, wird fiir das „Beat 
Tracking" eingesetzt. 

Der bekannte Algorithmus ist in Fig. 3 als Blockdiagramm 
dargestellt. Das Audiosignal wird iiber einen Audioeingang 300 
einer Analyse-Filterbank 302 zugefiihrt. Die Analyse-Filterbank 
erzeugt aus dem Audioeingang eine Anzahl n von Kanalen, d. h. 
von einzelnen Teilbandsignalen . Jedes Teilbandsignal enthalt 
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einen bestimmten Bereich an Frequenzen des Audiosignals . Die 
Filter der Analyse-Filterbank sind so ausgewahlt, dass sie die 
Selektionscharakteristik des menschlichen Innenohrs annahern. 
Eine solche Analyse-Filterbank wird auch als Gamma-Ton- 
Filterbank bezeichnet. 

In den Einrichtungen 304a bis 304c warden die Rhythmus- 
Inf ormationen jedes Teilbandsignals ausgewertet. Fur jedes Ein- 
gangssignal wird zunachst ein hiillkurvenartiges Ausgangssignal 
berechnet (entsprechend einer sogenannten ,,Inner Hair Cell^'- 
Verarbeitung im Ohr) und unterabgetastet . Aus diesem Resultat 
wird eine Autokorrelationsf unktion (AKF) berechnet, um die Peri- 
odizitat des Signals als Funktion der Verzogerung, d. h. des 
„Lag'^ zu erhalten. 

Am Ausgang der Einrichtungen 304a bis 304c liegt dann fiir jedes 
Teilbandsignal eine Autokorrelationsf unktion vor, welche die 
Rhythmus-Informationen jedes Teilbandsignals darstellt. 

Die einzelnen Autokorrelationsf unktionen der Teilbandsignale 
warden dann in einer Einrichtung 306 durch Summation kombiniert, 
um eine Summenautokorrelationsf unktion (SAKF) zu erhalten, wel- 
^ che Aspekte der Rhythmus-Informationen des Signals am Audio- 
"^Zj Eingang 300 wiedergibt. Diese Inf ormationen konnen an einem Tem- 
po-Ausgang 308 ausgegeben werden. GroJJe Werte in der Summenauto- 
korrelation zeigen an, dass fiir eine einer Spitze der SAKF zuge- 
ordneten Verzogerung (Lag) eine hohe Periodizitat der Notenan- 
fange vorliegt. Daher wird beispielsweise der groJite Wert der 
Summenautokorrelationsfunktion innerhalb der musikalisch sinn- 
vollen Verzogerungen gesucht. 

Musikalisch sinnvolle Verzogerungen sind beispielsweise der Tem- 
pobereich zwischen 60 bpm und 200 bpm. Die Einrichtung 306 kann 
ferner angeordnet sein, um eine Verzogerungszeit in Tempoinfor- 
mationen umzusetzen. So entspricht beispielsweise eine Spitze 



einer Verzogerung von einer Sekunde einem Tempo von 60 Schlagen 
pro Minute. Kleinere Verzogerungen deuten auf hohere Tempos hin, 
wahrend groBere Verzogerungen auf kleinere Tempos als 60 bpm 
hinweisen . 

Dieses Verfahren hat gegenuber dem zuerst genannten Verfahren 
einen Vorteil dahingehend, dass keine Oszillatoren mit groiiem 
Rechen- und Speicherauf wand implementiert werden miissen. Ande- 
rerseits ist das Konzept dahingehend nachteilhaf t^ dass die Qua- 
litat der Ergebnisse sehr stark von der Art des Audiosignals ab~ 
hangt. Ist aus einem Audiosignal beispielsweise ein dominantes 
Rhythmusinstrument herauszuhoren, so wird das in Fig. 3 be- 
schriebene Konzept gut f unktionieren . Ist dagegen die Stimme do- 
minant, welche keine besonders eindeutigen Rhythmusinf ormationen 
liefern wird, so wird die Rhythmusbestimmung mehrdeutig sein. In 
dem Audiosignal konnte durchaus auch ein Band vorkommen, das le- 
diglich Rhythmusinf ormationen enthalt, wie z. B. ein hoheres 
Frequenzband, in dem beispielsweise ein Hihat eines Schlagzeugs 
positioniert ist, oder ein niedriges Frequenzband, in dem die 
grofie Trommel eines Schlagzeugs auf der Frequenzskala positio- 
niert ist. Aufgrund der Kombination der Einzelinf ormationen wer- 
den jedoch die einigermaBen eindeutigen Inf ormationen dieser 
speziellen Teilbander von den mehrdeutigen Inf ormationen der an- 
deren Teilbander iiberlagert bzw. „verwasserf . 

Ein weiteres Problem bei der Verwendung von Autokorrelations- 
funktionen zum Extrahieren der Periodizitat eines Teilbandsi- 
gnals besteht darin, dass die Summen-Autokorrelationsf unktion, 
die durch die Einrichtung 306 gewonnen wird, mehrdeutig ist. Die 
Summen-Autokorrelationsfunktion am Ausgang 306 ist dahingehend 
mehrdeutig, dass auch beim Vielfachen einer Verzogerung eine Au- 
tokorrelationsfunktions-Spitze erzeugt wird- Dies ist daraus 
verstandlich, dass eine Sinuskomponente mit einer Periode von 
to, wenn sie einer Autokorrelationsfunktionverarbeitung unterzo- 
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gen wird^ neben dem gewiinschten Maximum bei tO auch Maxima bei 
Vielfachen der Verzogerungen, d. h. bei 2t0, 3t0, usw. erzeugt. 

Die Fachverof fentlichung ,/A Computationally Efficient Multipitch 
Analysis Model^\ von Tolonen und Karjalainen, IEEE Transactions 
on Speech and Audio Processing, Band 8, Nr. 6, Nov. 2000, offen- 
bart ein rechenzeitef f izientes Modell fur eine Periodizitatsana- 
lyse von komplexen Audiosignalen . Das Rechenmodell teilt das Si- 
gnal in zwei Kanale auf, und zwar in einen Kanal unter 1000 Hz 
und einen Kanal iiber 1000 Hz. Hieraus wird eine Autokorrelation 
des unteren Kanals und eine Autokorrelation der Hiallkurve des 
oberen Kanals berechnet. Schlieiilich werden die beiden Autokor- 
• relationsf unktionen summiert . Urn die Mehrdeutigkeiten der Sum- 
menautokorrelationsfunktion zu eliminieren, wird die Summenauto- 
korrelationsfunktion weiterverarbeitet , urn eine sogenannte En- 
hanced Summary Autocorrelation Function (ESACF) (Weiterentwik- 
kelte Summenautokorrelationsfunktion) zu erhalten. Diese Nachbe- 
arbeitung der Summenautokorrelationsfunktion beinhaltet ein wie- 
derholtes Abziehen von mit ganzzahligen Faktoren gespreizten 
Versionen der Autokorrelationsf unktion von der Summenautokorre- 
lationsfunktion mit nachfolgender Begrenzung auf nicht-negative 
Werte . 

' Nachteilig an diesem Konzept ist die Tatsache, dass die durch 
die Autokorrelationsfunktionen in den Teilbandern pro Teilband 
erhaltenen Mehrdeutigkeiten erst in der Summenautokorrelations- 
funktion eliminiert werden, jedoch nicht unmittelbar dort, wo 
sie auftreten, namlich in den einzelnen Teilbandern. 

Ein weiterer Nachteil dieses Konzepts ist die Tatsache, daJ5 die 
Autokorrelationsf unktion an sich keinen Hinweis auf das doppel- 
te, dreifache, - . . des Tempos liefert, dem eine Autokorrelati- 
onsspitze zugeordnet ist. 
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Die Aufgabe der vorliegenden Erfindung besteht darin, eine 
Vorrichtung und ein Verfahren zum Analysieren eines Audiosignals 
hinsichtlich von Rhythmusinf ormationen unter Verwendung einer 
Autokorrelationsfunktion zu schaffen, das robust und 
rechenzeitef f izient ist . 

Diese Aufgabe wird durch eine Vorrichtung zum Analysieren eines 
Audiosignals nach Patentanspruch 1, 8 oder 9, oder durch ein 
Verfahren zum Analysieren eines Audiosignals nach Patentanspruch 
7, 10, 11 gelost. 

Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, dal5 
eine Nachbearbeitung einer Autokorrelationsfunktion teilbandwei- 
se durchgefuhrt werden kann, um die Mehrdeutigkeiten der Auto- 
korrelationsfunktion fiir periodische Signale zu eliminieren bzw. 
Tempoinf ormationen, die eine Autokorrelationsverarbeitung nicht 
liefert, den durch eine Autokorrelationsfunktion erhaltenen In- 
f ormationen hinzugefugt werden. GemaB einem Aspekt der vorlie- 
genden Erfindung wird eine Autokorrelationsf unktion-Nachbearbei- 
tung der Teilbandsignale verwendet, um die Mehrdeutigkeiten be- 
reits „an der Wurzel"" zu beseitigen, bzw. ,,fehlende'' Rhythmusin- 
f ormationen hinzuzuf iigen . 

; GemaB einem weiteren Aspekt der vorliegenden Erfindung wird eine 
Nachbearbeitung der Summenautokorrelationsf unktion durchgefuhrt, 
um nachbearbeitete Rhythmus-Rohinf ormationen fur das Audiosignal 
zu erhalten, so dal3 in den nachbearbeiteten Rhythmus- 
Rohinf ormationen ein Signalanteil bei einem ganzzahligen Bruch- 
teil einer Verzogerung, der eine Autokorrelationsf unktionsspitze 
zugeordnet ist, hinzugefugt ist. Hierdurch ist es moglich, die 
durch eine Autokorrelationsfunktion nicht erhaltenen Rhythmusin- 
f ormationen bei doppelten, dreifachen etc. Tempi bzw. bei ratio- 
nalen Vielfachen durch Berechnen von um einen ganzzahligen Fak- 
tor Oder um einen rationalen Faktor gestauchten Versionen der 
Autokorrelationsfunktion und durch Addieren dieser Versionen zur 



9 



urspriinglichen Autokorrelationsf unktion zu erzeugen. Im Gegen- 
satz zum Stand der Technik, bei dem hierzu eine aufwendige Os- 
zillatorenbank benotigt wird, geschieht dies erf indungsgemaB mit 
einfach zu implementierenden Gewichtungs- und Additionsroutinen . 

Gemaii einem weiteren Aspekt der vorliegenden Erfindung wird die 
Summenautokorrelationsfunktion ferner nachbearbeitet , indem eine 
mit einem Faktor, der groiier als Null und kleiner als Eins ist, 
gewichtete, um einen ganzzahligen Faktor groiier als Eins ge- 
spreizte Version der Rhythmus-Rohinf ormationen zu der Autokorre- 
lationsf unktion subtrahiert wird. Dies hat den Vorteil einer 
Elimination der AKF-Mehrdeutigkeiten bei den ganzzahligen Viel- 
f achen der Verzogerung, der eine Autokorrelationsspitze zugeord- 
net ist- Wahrend im Stand der Technik keine Gewichtung der ge- 
spreizten Versionen der Autokorrelationsf unktion vor der Sub- 
traktion durchgefiihrt wird, und eine Elimination der Mehrdeutig- 
keiten somit nur im theoretisch optimalen Fall erreicht wird, 
bei dem der Rhythmus sich ideal zyklisch wiederholt, liefert die 
gewichtete Subtraktion die Moglichkeit, durch geeignete Wahl der 
Gewichtungsf aktoren, die beispielsweise empirisch erfolgen kann, 
Rhythmusinf ormationen, die sich nicht ideal zyklisch wiederho- 
len, zu beriicksichtigen . 

,^1^^/Gemai3 einem bevorzugten Ausf iihrungsbeispiel der vorliegenden Er- 
findung wird eine Autokorrelationsf unktion-Nachverarbeitung 
durchgefiihrt, indem die mittels einer Autokorrelationsf unktion 
bestimmten Rhythmus-Rohinf ormationen mit gestauchten und/oder 
gespreizten Versionen derselben kombiniert werden. Im Falle der 
Verwendung von gespreizten Versionen der Rhythmus- 
Rohinf ormationen werden die gespreizten Versionen von den Rhyth- 
mus-Rohinf ormationen subtrahiert, wahrend im Falle von um ganz- 
zahlige Faktoren gestauchten Versionen der Autokorrelationsf unk- 
tion diese gestauchten Versionen zu den Rhythmus- 
Rohinf ormationen hinzuaddiert werden . 



Bei einem bevorzugten Ausf iihrungsbeispiel der Erfindung wird die 
gestauchte/gespreizte Version vor dem Addieren bzw. Subtrahieren 
mit einem Faktor zwischen Null und Eins gewichtet. 

Gemafi einem weiteren bevorzugten Ausf iihrungsbeispiel der vor- 
liegenden Erfindung wird eine Qualitatsbeurteilung der Rhythmus- 
Rohinf ormationen^ um ein Signif ikanzmaB zu erhalten, auf der Ba- 
sis der nachverarbeiteten Rhythmus-Rohinf ormationen durchge- 
fiihrt, derart, daJi die Qualitatsbeurteilung nicht mehr durch Au- 
tokorrelationsf unktions-Artef akte beeinflulit wird. Damit wird 
eine sichere Qualitatsbeurteilung moglich, wodurch die Robust- 
heit des Bestimmens von Rhythmusinf ormationen des Audiosignals 
welter gesteigert werden kann. 

Alternativ kann die Qualitatsbeurteilung bereits vor der AKF- 
Nachverarbeitung stattfinden. Dies hat den Vorteil, dalJ, wenn 
ein flacher Verlauf der Rhythmus-Rohinf ormationen festgestellt 
wird, d.h, keine ausgepragten Rhythmusinf ormationen, auf die 
AKF-Nachverarbeitung fiir dieses Teilbandsignal verzichtet werden 
kann, da dieses Teilband aufgrund seiner wenig aussagekraf tigen 
Rhythmus-Informationen beim Ermitteln der Rhythmusinf ormationen 
des Audiosignals ohnehin keine Rolle spielen wird, Auf diese Art 
und Weise kann der Rechen- und Speicheraufwand welter reduziert 
^ werden . 

In den einzelnen Frequenzbandern, d. h. den Teilbandern, liegen 
oftmals unterschiedlich giinstige Bedingungen fiir das Auffinden 
von rhythmischen Periodizitaten vor. Wahrend beispielsweise bei 
Popmusik oftmals im Bereich der Mitte, beispielsweise um 1 kHz, 
das Signal von nicht mit dem Beat korrespondierenden Gesang do- 
miniert wird, sind in den hoheren Frequenzbereichen oftmals vor 
allem Perkussionsklange prasent, wie z. B. das Hihat des Schlag- 
zeugs, welche eine sehr gute Extraktion rhythmischer RegelmaJiig- 
keiten erlauben. Anders ausgedriickt beinhalten unterschiedliche 
Frequenzbander je nach Audiosignal eine unterschiedliche Menge 



an rhythmischer Information bzw. haben eine unterschiedliche 
Qualitat Oder Signifikanz fiir die Rhythmusinf ormationen des Au- 
diosignals . 

Das Audiosignal wird daher zunachst in Teilbandsignale zerlegt. 
Jedes Teilbandsignal wird hinsichtlich seiner Periodizitat un- 
tersucht, um Rhythmus-Rohinf ormationen fiir jedes Teilbandsignal 
zu erhalten. Hierauf wird gemaB einem bevorzugten Ausfiihrungs- 
beispiel der vorliegenden Erfindung eine Bewertung der Qualitat 
der Periodizitat jedes Teilbandsignals durchgef iihrt , um ein Si- 
gnif ikanzmali fur jedes Teilbandsignal zu erhalten. Ein hohes Si- 
gnif ikanzmali deutet darauf hin, dass in diesem Teilbandsignal 
^^deutliche Rhythmusinf ormationen vorliegen^ wahrend ein niedriges 
Signif ikanzmafi) darauf hindeutet, dass in diesem Teilbandsignal 
weniger eindeutige Rhythmusinf ormationen vorliegen. 

Gemaii einem bevorzugten Ausf uhrungsbeispiel der vorliegenden Er- 
findung wird bei der Untersuchung eines Teilbandsignals hin- 
sichtlich seiner Periodizitaten zunachst eine modifizierte Htill- 
kurve des Teilbandsignals berechnet und dann eine Autokorrelati- 
onsfunktion der Hullkurve berechnet- Die Autokorrelationsf unkti- 
on der Hullkurve stellt die Rhythmus-Rohinf ormationen dar. Ein- 
deutige Rhythmusinf ormationen liegen vor, wenn die Autokorrela- 
^ tionsfunktion deutliche Maxima aufweist, wahrend weniger eindeu- 
tige Rhythmusinf ormationen vorliegen, wenn die Autokorrelations- 
funktion der Hullkurve des Teilbandsignals weniger ausgepragte 
Signalspitzen oder uberhaupt keine Signalspitzen hat. Eine Auto- 
korrelationsf unktion, die deutliche Signalspitzen hat, wird da- 
her ein hohes Signif ikanzmafi erhalten, wahrend eine Autokorrela- 
tionsf unktion, die einen relativ flachen Verlauf hat, ein nied- 
riges Signif ikanzmafi erhalten wird. Die Artefakte der Autokorre- 
lationsf unktionen werden, wie oben ausgefuhrt, erf indungsgemafi 
eliminiert. 



da Teilbandsignale mit keinen eindeutigen bzw. sogar abweichen- 
den Rhythmusinf ormationen, d. h. wenn der Gesang einen anderen 
Rhythmus aufweist als der eigentliche Beat des Stiicks, die 
Rhythmusinf ormationen des Audiosignals nicht ,,verwassern^^ bzw. 
,,verf alschen^^ . Dariiber hinaus werden sehr rauschartige Teilband- 
signale, welche eine Systemautokorrelationsf unktion mit voll- 
standig flachem Verlauf liefern, das Signal/Rausch-Verhaltnis 
bei der Bestiiranung der Rhythmusinf ormationen nicht verschlech- 
tern. Genau dies wurde jedoch auftreten, wenn, wie im Stand der 
Technik, einfach alle Autokorrelationsf unktionen der Teilbandsi- 
gnale mit gleichem Gewicht aufsummiert werden. 

A Ein weiterer Vorteil des beschriebenen Verfahrens besteht darin, 
dass mit einem kleinen zusatzlichen Rechenauf wand ein Signifi- 
kanzmaft bestimmt werden kann, und dass die Bewertung der Rhyth- 
mus-Rohinf ormationen mit dem Signif ikanzmali und die anschlieBen- 
de Summierung ohne grolJen Speicher- und Rechenzeitauf wand effi- 
zient durchgefuhrt werden konnen, was das erf indungsgemaJie Kon- 
zept insbesondere auch fur Echtzeitanwendungen empfiehlt. 

Bevorzugte Ausf uhrungsbeispiele der vorliegenden Erfindung wer- 
den nachfolgend bezugnehmend auf die beiliegenden Zeichnungen 
detailliert erlautert. Es zeigen: 

J 

Fig. 1 ein Blockschaltbild einer Vorrichtung zum Analysieren 
eines Audiosignals mit einer Qualitatsbewertung der 
Rhythmus -Rohinf ormationen; 

Fig. 2 ein Blockschaltbild einer Vorrichtung zum Analysieren 

eines Audiosignals unter Verwendung von Gewichtungsf ak- 
toren auf der Basis der Signif ikanzmafie; 

Fig. 3 ein Blockschaltbild einer bekannten Vorrichtung zum Ana- 
lysieren eines Audiosignals hinsichtlich von Rhythmusin- 
formationen; 
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Fig. 4 ein Blockschaltbild einer Vorrichtung zum Analysieren 

eines Audiosignals hinsichtlich von Rhythmusinf ormatio- 
nen unter Verwendung einer Autokorrelationsf unktion mit 
einer teilbandweisen Nachbearbeitung der Rhythmus- 
Rohinf ormationen; und 

Fig. 5 ein detailliertes Blockschaltbild der Einrichtung zum 
Nachbearbeiten von Fig. 4. 

Fig. 1 zeigt ein Blockschaltbild einer Vorrichtung zum Analysie- 
ren eines Audiosignals hinsichtlich von Rhythmusinf ormationen . 
Das Audiosignal wird liber einen Eingang 100 einer Einrichtung 
102 zum Zerlegen des Audiosignals in zumindest zwei Teilbandsi- 
gnale 104a und 104b zugefuhrt. Jedes Teilbandsignal 104a, 104b 
wird in eine Einrichtung 106a bzw. 106b zum Untersuchen dessel- 
ben hinsichtlich von Periodizitaten in dem Teilbandsignal zuge- 
fiihrt, um Rhythmus-Rohinf ormationen 108a bzw. 108b fur jedes 
Teilbandsignal zu erhalten. Die Rhythmus-Rohinf ormationen werden 
dann einer Einrichtung 110a bzw. 110b zum Bewerten einer Quali- 
tat der Periodizitat jedes der zumindest zwei Teilbandsignale 
zugefuhrt, um ein Signif ikanzmaii 112a, 112b fiir jedes der zumin- 
dest zwei Teilbandsignale zu erhalten. Sowohl die Rhythmus- 
Rohinf ormationen 108a, 108b als auch die Signif ikanzmafie 112a, 
112b werden einer Einrichtung 114 zum Ermitteln der Rhythmusin- 
formationen des Audiosignals zugefuhrt. Die Einrichtung 114 be- 
rucksichtigt beim Ermitteln der Rhythmusinf ormationen des Audio- 
signals die Signif ikanzmalie 112a, 112b fur die Teilbandsignale 
sowie die Rhythmus-Rohinf ormationen 108a, 108b von zumindest ei- 
nem Teilbandsignal. 

Hat die Einrichtung 110a zur Qualitatsbewertung beispielsweise 
f estgestellt, dass in dem Teilbandsignal 104a keine besondere 
Periodizitat vorliegt, so wird das Signif ikanzmaJi 112a sehr 
klein, bzw. gleich 0 sein. In diesem Fall stellt die Einrichtung 
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114 zum Ermitteln der Rhythmusinf ormationen fest, dass das Si- 
gnif ikanzmali 112a gleich Null ist, so dass die Rhythmus- 
Rohinformationen 108a des Teilbandsignals 104a bei der Ermitt- 
lung der Rhythmusinf ormationen des Audiosignals iiberhaupt nicht 
mehr berucksichtigt werden miissen. Die Rhythmusinf ormationen des 
Audiosignals werden dann allein und ausschlieBlich auf der Basis 
der Rhythmus-Rohinformationen 108b des Teilbandsignals 104b be- 
stimmt . 

Im nachf olgenden wird auf Fig. 2 hinsichtlich einer speziellen 
Ausf lihrungsf orm der Vorrichtung von Fig. 1 eingegangen. Als Ein- 
richtung 102 zum Zerlegen des Audiosignals kann eine iibliche 
Analyse-Filterbank verwendet werden, die ausgangsseitig eine von 
einem Benutzer wahlbare Anzahl von Teilbandsignalen liefert. Je- 
des Teilbandsignal wird dann der Verarbeitung der Einrichtungen 
106a, 106b bzw. 106c unterzogen, woraufhin dann durch die Ein- 
richtungen 110a bis 110c von jeden Rhythmus-Rohinformationen Si- 
gnif ikanzmalie ermittelt werden. Die Einrichtung 114 umfafit bei 
der in Fig. 2 dargestellten bevorzugten Ausf lihrungsf orm eine 
Einrichtung 114a zum Berechnen von Gewichtungsf aktoren fur jedes 
Teilbandsignal auf der Basis des Signif ikanzmafies fur dieses 
Teilbandsignal und optional auch der anderen Teilbandsignale . In 
der Einrichtung 114b findet dann eine Gewichtung der Rhythmus- 
Rohinformationen 108a bis 108c mit dem Gewichtungsf aktor ftir 
dieses Teilbandsignal statt, woraufhin dann, ebenfalls in der 
Einrichtung 114b, die gewichteten Rhythmus-Rohinformationen kom- 
biniert, z. B, aufsummiert, werden, um an dem Tempo-Ausgang 116 
die Rhythmusinf ormationen des Audiosignals zu erhalten. 

Das erf indungsgemafie Konzept stellt sich somit f olgendermalien 
dar. Nach der Evaluierung der rhythmischen Inf ormationen der 
Einzelbander , welche beispielsweise durch Hullkurvenbildung, 
Glattung, Dif f erenzieren, Begrenzen auf positive Werte und Bil- 
den der Autokorrelationsf unktion stattfinden kann (Einrichtungen 
106a bis 106c) , findet eine Bewertung der Wertigkeit bzw. der 



Qualitat dieser Zwischenergebnisse in den Einrichtungen 110a bis 
110c statt. Dies wird mit Hilfe einer Bewertungsf unktion er- 
reicht, welche die Verlasslichkeit der jeweiligen Einzelergeb- 
nisse mit einem Signif ikanzmali bewertet. Aus den Signif ikanzma- 
iien aller Teilbandsignale wird ein Gewichtungsf aktor fur jedes 
Band fiir die Extraktion der Rhythmus-Inf ormationen hergeleitet. 
Das Gesamtergebnis der Rhythmusextraktion wird dann in der Ein- 
richtung 114b durch Kombination der bandweisen Einzelergebnisse 
unter Beriicksichtigung ihrer jeweiligen Gewichtungsf aktoren er- 
reicht . 

Als Resultat zeigt ein solchermalien implementierter Algorithmus 
\zur Rhythmusanalyse eine gute Fahigkeit, rhythmische Informatio- 
nen in einem Signal auch unter ungiinstigen Bedingungen zuverlas- 
sig zu finden. Das erf indungsgemaJie Konzept zeichnet sich daher 
durch eine hohe Robustheit aus. 

Bei einer bevorzugten Ausf iihrungsf orm werden die Rhythmus- 
Rohinformationen 108a, 108b, 108c, die die Periodizitat des je- 
weiligen Teilbandsignals darstellen, mittels einer Autokorrela- 
tionsfunktion bestimmt. In diesem Fall wird es bevorzugt, das 
Signif ikanzmali zu bestimmen, indem ein Maximum der Autokorrela- 
tionsfunktion durch einen Mittelwert der Autokorrelationsf unkti- 
on geteilt wird, und dann der Wert 1 subtrahiert wird. Es sei 
darauf hingewiesen, daiS jede Autokorrelationsf unktion immer bei 
einer Verzogerung von 0 ein lokales Maximum, d. h. eine Spitze, 
liefert, die die Energie des Signals reprasentiert . Dieses loka- 
le Maximum sollte unberiicksicht igt bleiben, damit die Qualitats- 
bestimmung nicht verfalscht wird. 

Ferner soil die Autokorrelationsf unktion lediglich in einem spe- 
ziellen Tempobereich betrachtet werden, d. h. von einer maxima- 
len Verzogerung, die dem kleinsten interessierenden Tempo ent- 
spricht, zu einer minimalen Verzogerung, die dem hochsten inter- 
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essierenden Tempo entspricht- Ein typischer Tempobereich liegt 
zwischen 60 bpm und 200 bpm. 

Alternativ kann als Signif ikanzmaB das Verhaltnis zwischen dem 
arithmetischen Mittelwert der Autokorrelationsf unktion im inter- 
essierenden Tempobereich und dem geometrischen Mittelwert der 
Autokorrelationsfunktion im interessierenden Tempobereich be- 
stimmt werden, Es ist bekannt, dass wenn alle Werte der Autokor- 
relationsfunktion gleich sind, d. h. wenn die Autokorrelations- 
funktion einen flachen Verlauf hat, der geometrische Mittelwert 
der Autokorrelationsfunktion und der arithmetische Mittelwert 
der Autokorrelationsfunktion gleich sind. In diesem Fall hatte 
Mas Signif ikanzmaB einen Wert gleich 1, was bedeutet, dass die 
Rhythmus-Rohinf ormationen nicht signifikant sind. 

Im Falle einer Systemautokorrelationsf unktion mit starken Spit- 
zen wurde das Verhaltnis aus arithmetischem Mittelwert zu geome- 
trischem Mittelwert grofier 1 sein, was bedeutet, dass die Auto- 
korrelationsfunktion gute Rhythmusinf ormationen aufweist. Je 
kleiner jedoch das Verhaltnis zwischen arithmetischem Mittelwert 
und geometrischem Mittelwert wird, desto flacher ist die Auto- 
korrelationsfunktion und desto weniger Periodizitaten enthalt 
sie, was wiederum bedeutet, dass die Rhythmusinf ormationen die- 
ses Teilbandsignals weniger signifikant, d. h. eine geringere 
Qualitat haben, was sich in einem geringen bzw. einem Gewich- 
tungsfaktor von 0 auBern wird. 

Bezuglich der Gewichtungsf aktoren existieren verschiedene Mog- 
lichkeiten. Bevorzugt wird eine relative Gewichtung, derart, 
dass sich alle Gewichtungsf aktoren samtlicher Teilbandsignale zu 
1 aufaddieren, d. h. dass der Gewichtungsf aktor eines Bandes be- 
stimmt wird als der Signif ikanzwert dieses Bandes geteilt durch 
die Summe aller Signif ikanzwerte . In diesem Fall wird eine rela- 
tive Gewichtung vor der Aufsummation der gewichteten Rhythmus- 
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Rohinf ormationen durchgef uhrt ^ urn die Rhythmus-Inf ormationen des 
Audiosignals zu erhalten. 

Wie bereits ausgefiihrt worden ist, wird es bevorzugt, die Aus- 
wertung der Rhythmus-Inf ormationen unter Verwendung einer Auto- 
korrelationsfunktion durchzuf iihren . Dieser Fall ist in Fig. 4 
dargestellt. Das Audiosignal wird iiber den Audiosignaleingang 
100 in die Einrichtung 102 zum Zerlegen des Audiosignals in 
Teilbandsignale 104a und 104b eingespeist. Jedes Teilbandsignal 
wird dann in der Einrichtung 106a bzw. 106b, wie es ausgefiihrt 
worden ist, unter Verwendung einer Autokorrelationsf unktion un- 
tersucht, urn die Periodizitat des Teilbandsignals zu ermitteln. 
^Am Ausgang der Einrichtung 106a bzw. 106b liegen dann die Rhyth- 
mus-Rohinf ormationen 108a, 108b vor. Diese werden in eine Ein- 
richtung 118a bzw. 118b eingespeist, um die mittels der Autokor- 
relationsf unktion von der Einrichtung 116a ausgegebenen Rhyth- 
mus-Rohinf ormationen nachzubearbeiten . Damit wird u. a. sicher- 
gestellt, dali die Mehrdeutigkeiten der Autokorrelationsf unktion, 
d. h- daJ5 bei ganzzahligen Vielfachen der Verzogerungen eben- 
falls Signalspitzen auftreten, teilbandweise eliminiert werden, 
um nachbearbeitete Rhythmus-Rohinf ormationen 120a bzw. 120b zu 
erhalten. 

Dies hat den Vorteil, dass die Mehrdeutigkeiten der Autokorrela- 
tionsf unktionen, d. h. der Rhythmus-Rohinf ormationen 108a, 108b, 
bereits teilbandweise eliminiert werden, und nicht erst, wie im 
Stand der Technik, nach der Summation der einzelnen Autokorrela- 
tionsf unktionen . Daruber hinaus ermoglicht die einzelbandweise 
Eliminierung der Mehrdeutigkeiten in den Autokorrelationsf unk- 
tionen durch die Einrichtungen 118a, 118b, dass die Rhythmus- 
Rohinf ormationen der Teilbandsignale unabhangig voneinander ge- 
handhabt werden konnen. Sie konnen beispielsweise einer Quali- 
tatsbeurteilung mittels der Einrichtung 110a fur die Rhythmus- 
Rohinf ormationen 108a Oder mittels der Einrichtung 110b fur die 
Rhythmus-Rohinf ormationen 108b unterzogen werden. 
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Wie es durch die gestrichelten Linien in Fig. 4 dargestellt ist, 
kann die Qualitatsbeurteilung jedoch auch anhand der nachbear- 
beiteten Rhythmus-Rohinf ormationen stattfinden, wobei diese 
letztere Moglichkeit bevorzugt wird, da die Qualitatsbeurteilung 
auf der Basis der nachbearbeiteten Rhythmus-Rohinf ormationen si- 
cherstellt, dass die Qualitat einer Information beurteilt wird, 
die nicht mehr vieldeutig ist. 

Die Ermittlung der Rhythmus-Inf ormationen durch die Einrichtung 
114 findet dann auf der Basis von nachbearbeiteten Rhythmus- 
Inf ormationen eines Kanals und vorzugsweise auch auf der Basis 
des Signif ikanzmaJies fiir diesen Kanal statt- 

Wenn eine Qualitatsbeurteilung auf der Basis der Rhythmus- 
Rohinf ormationen, also des Signals vor der Einrichtung 118a 
durchgefuhrt wird, ist dies dahingehend vorteilhaft, dass, wenn 
bestimmt wird, dass das Signif ikanzmaB gleich 0 ist, d. h. dass 
die Autokorrelationsf unktion einen flachen Verlauf hat, auf die 
Nachbearbeitung mittels der Einrichtung 118a ganzlich verzichtet 
werden kann, um Rechenzeitressourcen einzusparen. 

Im nachf olgenden wird auf Fig. 5 eingegangen, um einen detail- 
lierteren Aufbau einer Einrichtung 118a Oder 118b zur Nachbear- 
beitung der Rhythmus-Rohinf ormationen darzustellen . Zunachst 
wird das Teilband-Signal beispielsweise 104a, in die Einrichtung 
106a zur Untersuchung der Periodizitat des Teilbandsignals mit- 
tels einer Autokorrelationsf unktion eingespeist, um Rhythmus- 
Rohinf ormationen 108a zu erhalten. Um die Mehrdeutigkei ten teil- 
bandweise zu eliminieren, kann genauso wie im Stand der Technik, 
eine gespreizte Autokorrelationsf unktion mittels einer Einrich- 
tung 121 berechnet werden, wobei die Einrichtung 121 angeordnet 
ist, um die gespreizte Autokorrelationsf unktion so zu berechnen, 
dass sie um ein ganzzahliges Vielf aches gespreizt ist. Eine Ein- 
richtung 122 ist in diesem Fall angeordnet, um die gespreizte 
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Autokorrelationsf unktion von der urspriinglichen Autokorrelati- 
onsfunktion, d. h. den Rhythmus-Rohinf ormationen 108a zu subtra- 
hieren. Insbesondere wird es bevorzugt, zunachst eine auf das 
Doppelte gespreizte Autokorrelationsf unktion in der Einrichtung 
121 zu berechnen und dann von den Rhythmus-Rohinf ormationen 108a 
zu subtrahieren . Dann, in dem nachsten Schritt, wird eine urn den 
Faktor 3 gespreizte Autokorrelationsfunktion in der Einrichtung 
121 berechnet und von dem Ergebnis der vorherigen Subtraktion 
wieder abgezogen, so dass nach und nach samtliche Mehrdeutigkei- 
ten aus den Rhythmus-Rohinf ormationen eliminiert werden. 

Daruber hinaus konnen die gespreizten Versionen der Rhythmus- 
Rohinf ormationen 108a vor dem Subtrahieren gewichtet werden, um 
auch hier eine Flexibilitat im Sinne einer hohen Robustheit zu 
erreichen . 

Durch das Verfahren, die Periodizitat eines Teilbandsignals auf 
der Basis einer Autokorrelationsfunktion zu untersuchen, kann 
also eine weitere Verbesserung erzielt werden, wenn die Eigen- 
schaften der Autokorrelationsfunktion mit einbezogen werden und 
die Nachbearbeitung unter Verwendung der Einrichtung 118a oder 
118b durchgefuhrt wird. So erzeugt eine periodische Folge von 
Notenanf angen mit einem Abstand tO nicht nur eine AKF-Spitze bei 
einer Verzogerung tO sondern auch bei 2t0, 3t0, etc. Dies wird 
zu einer Vieldeutigkeit in der Tempodetektion, d. h. dem Suchen 
signif ikanter Maxima in der Autokorrelationsfunktion, fuhren. 
Die Mehrdeutigkeiten konnen dadurch eliminiert werden, wenn um 
ganzzahlige Faktoren gespreizte Versionen der AKF vom Ausgangs- 
wert teilbandweise (gewichtet) abgezogen werden. 

Daruber hinaus konnen die gestauchten Versionen der Rhythmus- 
Rohinf ormationen 108a vor dem Addieren mit einem Faktor ungleich 
Eins gewichtet werden, um auch hier eine Flexibilitat im Sinne 
einer hohen Robustheit zu erreichen. 



Ferner besteht bei der Autokorrelationsf unktion das Problem, daii 
sie keine Inf ormationen bei tO/2, tO/3 ... usw., also beim Dop- 
pelten, Dreifachen, etc. des ,,Grundtempos^' liefert, was beson- 
ders dann zu falschen Ergebnissen fuhren kann, wenn zwei Instru- 
mente, die in unterschiedlichen Teilbandern liegen, zusammen den 
Rhythmus des Signals definieren. Diese Sache wird dadurch be- 
riicksichtigt, dass um ganzzahlige Faktoren gestauchte Versionen 
der Autokorrelationsf unktion berechnet werden und diese dann zu 
den Rhythmus-Rohinf ormationen gewichtet Oder ungewichtet hinzu- 
addiert werden. 

Die AKF~Nachverarbeitung findet somit teilbandweise statt, wobei 
fiir mindestens ein Teilbandsignal eine Autokorrelationsf unktion 
errechnet wird und diese mit gedehnten oder gespreizten Versio- 
nen dieser Funktion kombiniert wird. 

Gemafi einem anderen Aspekt der vorliegenden Erfindung wird zu- 
nachst die Summenautokorrelationsf unktion der Teilbander er- 
zeugt, woraufhin um ganzzahligen Faktoren gestauchte Versionen 
der Summenautokorrelationsf unktion vorzugsweise gewichtet hinzu- 
addiert werden, um die Unzulanglichkeiten der Autokorrelations- 
f unktion bei dem doppelten, dreifachen etc. Tempo auszuraumen. 

GemaB einem weiteren Aspekt wird die Nachbearbeitung der Summen- 
autokorrelationsf unktion, um die Mehrdeutigkeiten bei dem hal- 
ben, dem dritten Teil, dem vierten Teil etc. des Tempos zu eli- 
minieren, durchgef uhrt , indem die um ganzzahlige Faktoren ge- 
spreizten Versionen der Summenautokorrelationsf unktion nicht 
einfach subtrahiert werden, sondern vor der Subtraktion mit ei- 
nem Faktor ungleich Eins und vorzugsweise kleiner als Eins und 
groBer als Null gewichtet werden und dann erst subtrahiert wer- 
den. Damit wird eine robustere Bestimmung der Rhythmusinf orma- 
tionen moglich, da das ungewichtete Subtrahieren lediglich fur 



ideale sinusf ormige Signale eine vollstandige Elimination der 
AKF-Mehrdeutigkeiten lief ert . 



Patent anspruche 



1. Vorrichtung zum Analysieren eines Audiosignals hinsichtlich 
von Rhythmusinformationen des Audiosignals unter Verwendung ei- 
ner Autokorrelationsf unktion, mit folgenden Merkmalen: 

einer Einrichtung (102) zum Zerlegen des Audiosignals in zumin- 
dest zwei Teilbandsignale (104a, 104b) ; 

einer Einrichtung zum Untersuchen (106a, 106b) zumindest eines 
Teilbandsignals hinsichtlich einer Periodizitat in dem zumindest 
einen Teilbandsignal mittels einer Autokorrelationsf unktion, um 
Rhythmus-Rohinformationen (108a) fur das Teilbandsignal zu er- 
halten, wobei einer Spitze der Autokorrelationsf unktion eine 
Verzogerung zugeordnet ist; 

einer Einrichtung (118a) zum Nachbearbeiten der mittels der Au- 
tokorrelationsf unktion bestimmten Rhythmus-Rohinformationen 
(108a) fiir das Teilbandsignal (104a) , um nachbearbeitete Rhyth- 
mus-Rohinformationen (120a) fiir das Teilbandsignal zu erhalten, 
so dafi in den nachbearbeiteten Rhythmus-Rohinformationen eine 
Mehrdeutigkeit bei einem ganzzahligen Vielfachen einer Verzoge- 
rung, der eine Autokorrelationsf unktionsspitze zugeordnet ist, 
vermindert ist, Oder ein Signalanteil bei einem ganzzahligen 
Bruchteil einer Verzogerung, der eine Autokorrelationsf unktions- 
spitze zugeordnet ist, hinzugefiigt ist; und 

einer Einrichtung (114) zum Ermitteln der Rhythmusinformationen 
des Audiosignals unter Verwendung der nachbearbeiteten Rhythmus- 
Rohinformationen (120a) des Teilbandsignals und unter Verwendung 
eines weiteren Teilbandsignals der zumindest zwei Teil- 
bandsignale . 



2. Vorrichtung nach Anspruch 1, 



bei der die Einrichtung zum Nachbearbeiten (118a, 118b) folgende 
Merkmale auf weist : 

eine Einrichtung (121) zum Berechnen einer um einen ganzzahligen 
Faktor gespreizten Version der Rhythmus-Rohinf ormationen (108a) 
eines Teilbandsignals ; und 

einer Einrichtung (122) zum Subtrahieren der um einen ganzzahli- 
gen Faktor groJier als Eins gespreizten Version der Rhythmus- 
Rohinf ormationen (108a) des Teilbandsignals oder eine von dieser 
Version abgeleitete Version von den Rhythmus-Rohinf ormationen 
(108a) des Teilbandsignals, um die nachbearbeiteten Rhythmus- 
Rohinf ormationen (120a) fur das Teilbandsignal zu erhalten. 

3. Vorrichtung nach Anspruch 7., bei der die Einrichtung (122) 
zum Subtrahieren angeordnet ist, um vor dem Subtrahieren eine 
Gewichtung der gespreizten Version mit einem Faktor zwischen 
Null und Eins durchzuf iihren, um die abgeleitete Version zu er- 
zeugen. 

4. Vorrichtung nach Anspruch 1, bei der die Einrichtung zum 
Nachbearbeiten (118a) folgende Merkmale aufweist: 

eine Einrichtung (121) zum Berechnen einer um einen ganzzahligen 
Faktor grolber als Eins gestauchten Version der Rhythmus- 
Rohinf ormationen (108a) ; und 

eine Einrichtung (122) zum Addieren der gestauchten Version der 
Rhythmus-Rohinf ormationen des Teilbandsignals oder eine von die- 
ser Version abgeleitete Version zu den Rhythmus-Rohinf ormationen 
(108a) des Teilbandsignals, um die nachbearbeiteten Rhythmus- 
Rohinf ormationen (120a) fur das Teilbandsignal zu erhalten. 

5. Vorrichtung nach Anspruch 4, bei der die Einrichtung (122) 
zum Addieren angeordnet ist, um vor der Addition eine Gewichtung 



der gestauchten Version der Rhythmus-Rohinf ormationen mittels 
eines Faktors zwischen Null und Eins durchzuf uhren, derart^ dafi 
eine gewichtete gestauchte Version der Rhythmus-Rohinf ormationen 
zu den Rhythmus-Rohinf ormationen des Teilbandsignals hinzuad- 
diert wird, um die abgeleitete Version zu erzeugen. 

6. Vorrichtung nach einem der vorhergehenden Anspruche, die 
ferner folgendes Merkmal aufweist: 

eine Einrichtung (110a, 110b) zum Bewerten einer Qualitat der 
Periodizitat der nachverarbeiteten Rhythmus-Rohinf ormationen 
(120a), um ein Signif ikanzmaii fiir das Teilbandsignal zu erhal- 
ten, 

wobei die Einrichtung (114) zum Ermitteln ferner angeordnet ist, 
um die Rhythmusinf ormationen des Audiosignals unter Beriicksich- 
tigung des Signif ikanzmaJies des Teilbandsignals zu ermitteln. 

7- Verfahren zum Analysieren eines Audiosignals hinsichtlich 
von Rhythmusinf ormationen des Audiosignals unter Verwendung ei- 
ner Autokorrelationsf unktion, mit folgenden Schritten: 

Zerlegen (102) des Audiosignals in zumindest zwei Teilbandsigna- 
le (104a, 104b); 

Untersuchen (106a, 106b) zumindest eines Teilbandsignals hin- 
sichtlich einer Periodizitat in dem zumindest einen Teilbandsi- 
gnal mittels einer Autokorrelationsf unktion, um Rhythmus- 
Rohinf ormationen (108a) fiir das Teilbandsignal zu erhalten, wo- 
bei einer Spitze der Autokorrelationsf unktion eine Verzogerung 
zugeordnet ist; 

Nachbearbeiten (118a) der mittels der Autokorrelationsf unktion 
bestimmten Rhythmus-Rohinf ormationen (108a) fiir das Teilbandsi- 
gnal (104a), um nachbearbeitete Rhythmus-Rohinf ormationen (120a) 
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fiir das Teilbandsignal zu erhalten, so daB in den nachbearbeite- 
ten Rhythmus-Rohinf ormationen eine Mehrdeutigkeit bei einem 
ganzzahligen Vielfachen einer Verzogerung, der eine Autokorrela- 
tionsf unktionsspitze zugeordnet ist, vermindert ist, oder ein 
Signalanteil bei einem ganzzahligen Bruchteil einer Verzogerung, 
der eine Autokorrelationsf unktionsspitze zugeordnet ist, hinzu- 
gefugt ist; und 

Ermitteln (114) der Rhythmusinf ormationen des Audiosignals unter 
Verwendung der nachbearbeiteten Rhythmus-Rohinf ormationen (120a) 
des Teilbandsignals und unter Verwendung eines weiteren Teil- 
. bandsignals der zumindest zwei Teilbandsignale . 

m • 

8. Vorrichtung zum Analysieren eines Audiosignals hinsichtlich 
von Rhythmusinf ormationen des Audiosignals unter Verwendung ei- 
ner Autokorrelationsf unktion, mit folgenden Merkmalen: 

einer Einrichtung zum Untersuchen des Audiosignals hinsichtlich 
einer Periodizitat in dem Audiosignal, um Rhythmus- 
Rohinf ormationen fiir das Audiosignal zu erhalten, wobei einer 
Spitze der Autokorrelationsf unktion eine Verzogerung zugeordnet 
ist; 

'einer Einrichtung zum Nachbearbeiten der mittels der Autokorre- 
lationsf unktion bestimmten Rhythmus-Rohinf ormationen fiir das Au- 
diosignal, um nachbearbeitete Rhythmus-Rohinf ormationen fiir das 
Audiosignal zu erhalten, so daii in den nachbearbeiteten Rhyth- 
mus-Rohinf ormationen ein Signalanteil bei einem ganzzahligen 
Bruchteil einer Verzogerung, der eine Autokorrelationsf unktions- 
spitze zugeordnet ist, hinzugefiigt ist; und 

einer Einrichtung zum Ermitteln der Rhythmusinf ormationen des 
Audiosignals unter Verwendung der nachbearbeiteten Rhythmus- 
Rohinf ormationen des Audiosignals- 



9. Vorrichtung zum Analysieren eines Audiosignals hinsichtlich 
von Rhythmusinf ormationen des Audiosignals unter Verwendung ei- 
ner Autokorrelationsf unktion, mit folgenden Merkmalen: 

einer Einrichtung zum Untersuchen des Audiosignals hinsichtlich 
einer Periodizitat in dem Audiosignal, um Rhythmus- 
Rohinf ormationen fiir das Audiosignal zu erhalten, wobei einer 
Spitze der Autokorrelationsf unktion eine Verzogerung zugeordnet 
ist; 

einer Einrichtung zum Nachbearbeiten der mittels der Autokorre- 
lationsf unktion bestimmten Rhythmus-Rohinf ormationen fiir das Au- 
^ diosignal, um nachbearbeitete Rhythmus-Rohinf ormationen fur das 
Audiosignal zu erhalten, durch Subtrahieren einer mit einem Fak- 
tor ungleich Eins gewichteten, um einen ganzzahligen Faktor gro- 
fier als Eins gespreizten Version der Rhythmus-Rohinf ormationen; 
und 

einer Einrichtung zum Ermitteln der Rhythmusinf ormationen des 
Audiosignals unter Verwendung der nachbearbeiteten Rhythmus- 
Rohinf ormationen des Audiosignals. 

10. Verfahren zum Analysieren eines Audiosignals hinsichtlich 
'^von Rhythmusinf ormationen des Audiosignals unter Verwendung ei- 
ner Autokorrelationsf unktion^ mit folgenden Schritten: 

Untersuchen des Audiosignals hinsichtlich einer Periodizitat in 
dem Audiosignal, um Rhythmus-Rohinf ormationen fur das Audiosi- 
gnal zu erhalten, wobei einer Spitze der Autokorrelationsf unkti- 
on eine Verzogerung zugeordnet ist; 

Nachbearbeiten der mittels der Autokorrelationsf unktion bestimm- 
ten Rhythmus-Rohinf ormationen fiir das Audiosignal, um nach- 
bearbeitete Rhythmus-Rohinf ormationen fiir das Audiosignal zu er- 
halten, so dafi in den nachbearbeiteten Rhythmus-Rohinf ormationen 
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ein Signalanteil bei einem ganzzahligen Bruchteil einer Verzoge- 
rung, der eine Autokorrelationsf unktionsspitze zugeordnet ist^ 
hinzugefligt ist; und 

Ermitteln der Rhythmusinf ormationen des Audiosignals unter Ver- 
wendung der nachbearbeiteten Rhythmus-Rohinf ormationen des Au- 
diosignals . 

11. Verfahren zum Analysieren eines Audiosignals hinsichtlich 
von Rhythmusinf ormationen' des Audiosignals unter Verwendung ei- 
ner Autokorrelationsf unktion, mit folgenden Schritten: 

Untersuchen des Audiosignals hinsichtlich einer Periodizitat in 
dem Audiosignal, um Rhythmus-Rohinf ormationen fiir das Audiosi- 
gnal zu erhalten, wobei einer Spitze der Autokorrelationsf unkti- 
on eine Verzogerung zugeordnet ist; 

Nachbearbeiten der mittels der Autokorrelationsfunktion bestimm- 
ten Rhythmus-Rohinf ormationen fiir das Audiosignal, um nach- 
bearbeitete Rhythmus-Rohinf ormationen fiir das Audiosignal zu er- 
halten, durch Subtrahieren einer mit einem Faktor ungleich Eins 
gewichteten, um einen ganzzahligen Faktor grolJer als Eins ge- 
spreizten Version der Rhythmus-Rohinf ormationen; und 

Ermitteln der Rhythmusinf ormationen des Audiosignals unter Ver- 
wendung der nachbearbeiteten Rhythmus-Rohinf ormationen des Au- 
diosignals • 



Vorrichtung zum Analysieren eines Audiosignals hinslchtlich von 
Rhythmusinformatlonen des Audiosignals unt:er Verwendung exner 

Aut:okorrelat:ions£unkt:lon 

Zusammenf assunq 

Eine Vorrichtung zum Analysieren eines Audiosignals hinslchtlich 
von Rhythmusinformatlonen des Audiosignals unter Verwendung ei- 
ner Autokorrelationsf unktion umfaBt eine Filterbank zum Zerle- 
gen des Audiosignals in zumindest zwei Teilbandsignale . Die 
Teilbandsignale werden hinslchtlich von Periodizitaten mittels 
einer Autokorrelationsf unktion untersucht, um Rhythmus- 
Rohinf ormationen fur die zumindest zwei Teilbandsignale zu er- 
halten. Um die Mehrdeutigkeiten der Autokorrelationsf unktion fur 
periodische Signale zu verringern oder zu eliminieren, werden 
die Rhythmus-Rohinf ormationen nachbearbeitet , um nachbearbeitete 
Rhythmus-Rohinf ormationen fur das Teilbandsignal zu erhalten. 
Die Rhythmusinformatlonen des Audiosignals werden auf der Basis 
der nachbearbeiteten Rhythmus-Rohinf ormationen ermittelt. Durch 
die teilbandweise AKF-Nachverarbeitung werden AKF- 

Mehrdeutigkeiten bereits dort, wo sie entstehen, eliminiert, 
bzw. werden Rhythmusanteile bei doppelten Tempi ^ die eine Auto- 
korrelationsf unktionsverarbeitung normalerweise nicht lief ert^ 
^ hinzugefugt^ so dafi sich als Resultat eine robustere Bestimmung 
der Rhythmus-Inf ormationen des Audiosignals ergibt. 
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